Stable Diffusion সেটআপ করতে Python এবং PyTorch ব্যবহার করা হয়। এটি করার জন্য, Python পরিবেশ তৈরি করা এবং PyTorch ও অন্যান্য নির্ভরশীল লাইব্রেরিগুলো ইনস্টল করা প্রয়োজন। নিচে ধাপে ধাপে Stable Diffusion সেটআপের নির্দেশনা দেওয়া হলো:
ধাপ ১: Python পরিবেশ তৈরি করা
প্রথমে, একটি ভার্চুয়াল পরিবেশ তৈরি করা সেরা পদ্ধতি যাতে নির্ভরশীলতা গুলো আলাদা রাখা যায়।
# ভার্চুয়াল এনভায়রনমেন্ট তৈরি করা
python -m venv stable_diffusion_env
# ভার্চুয়াল এনভায়রনমেন্ট অ্যাক্টিভেট করা
# Windows:
stable_diffusion_env\Scripts\activate
# macOS/Linux:
source stable_diffusion_env/bin/activate
ধাপ ২: PyTorch ইনস্টল করা
Stable Diffusion রান করার জন্য PyTorch প্রয়োজন। GPU সাপোর্ট পেতে হলে, CUDA সহ PyTorch ইনস্টল করতে হবে।
# PyTorch ইনস্টল করা (CUDA 11.7 সাপোর্ট সহ) - আপনার সিস্টেমের জন্য কনফিগারেশন মিলিয়ে নিন
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
ধাপ ৩: diffusers লাইব্রেরি ইনস্টল করা
Hugging Face-এর diffusers লাইব্রেরি Stable Diffusion এবং অন্যান্য ডিফিউশন মডেল পরিচালনার জন্য ব্যবহৃত হয়। এটি ইনস্টল করতে:
pip install diffusers
ধাপ ৪: অন্যান্য নির্ভরশীলতা ইনস্টল করা
Stable Diffusion পরিচালনা করতে প্রয়োজনীয় আরও কিছু লাইব্রেরি ইনস্টল করতে হবে, যেমন: transformers, accelerate, এবং scipy।
pip install transformers accelerate scipy
ধাপ ৫: মডেল লোড এবং রান করা
এখন মডেল লোড করার জন্য কোড লিখতে হবে। নিচে একটি সিম্পল উদাহরণ দেওয়া হল যেখানে Stable Diffusion মডেল লোড এবং ইমেজ জেনারেশন করা হয়েছে:
import torch
from diffusers import StableDiffusionPipeline
# ডিভাইস সেট করা (GPU থাকলে CUDA ব্যবহার করা হবে)
device = "cuda" if torch.cuda.is_available() else "cpu"
# Stable Diffusion মডেল লোড করা
pipeline = StableDiffusionPipeline.from_pretrained("CompVis/stable-diffusion-v1-4").to(device)
# একটি প্রম্পট ডিফাইন করা
prompt = "A fantasy landscape with mountains and rivers, digital art"
# ইমেজ জেনারেট করা
with torch.autocast("cuda"):
image = pipeline(prompt).images[0]
# ইমেজ সেভ করা
image.save("generated_image.png")
ব্যাখ্যা:
মডেল লোড করা:
StableDiffusionPipeline.from_pretrained("CompVis/stable-diffusion-v1-4")ব্যবহার করে মডেল লোড করা হয়েছে। এটি Hugging Face-এর মডেল হাব থেকে লোড করে।.to(device)ব্যবহার করে মডেলকে GPU তে মুভ করা হয়েছে, যদি GPU উপস্থিত থাকে।
প্রম্পট দিয়ে ইমেজ জেনারেশন:
pipeline(prompt)দ্বারা প্রম্পট ইনপুট দেওয়া হয়েছে, এবং এটি ইমেজ জেনারেট করেছে।torch.autocast("cuda")ব্যবহৃত হয়েছে যাতে অটোমেটিকভাবে মডেলটি CUDA অপ্টিমাইজেশনের সুবিধা নেয়।
ইমেজ সংরক্ষণ:
image.save("generated_image.png")দিয়ে জেনারেট করা ইমেজ.pngফরম্যাটে সেভ করা হয়েছে।
টিপস:
- GPU সাপোর্ট: মডেলটি GPU তে রান করলে ইমেজ জেনারেশন দ্রুত হবে। আপনার সিস্টেমে NVIDIA GPU এবং CUDA সঠিকভাবে কনফিগার করা থাকতে হবে।
- মডেল আপডেট: Hugging Face-এর মডেল হাব থেকে বিভিন্ন সংস্করণের মডেল (যেমন: v1.5, v2.0) ব্যবহার করা যেতে পারে। আপনাকে শুধু সঠিক মডেল আইডি ব্যবহার করতে হবে।
অতিরিক্ত তথ্য:
- Jupyter Notebook বা Google Colab ব্যবহার করলে, সিস্টেমে GPU আছে কিনা তা সহজেই চেক করা যায় এবং লাইব্রেরিগুলো ইনস্টল করা দ্রুত হয়।
- Hugging Face-এর diffusers ডকুমেন্টেশন এবং PyTorch ডকুমেন্টেশন থেকে আরও বিস্তারিত সেটআপ এবং কনফিগারেশন নির্দেশনা পাওয়া যাবে।
এইভাবে, আপনি Python এবং PyTorch ব্যবহার করে Stable Diffusion সেটআপ করতে পারেন এবং ইমেজ জেনারেশন শুরু করতে পারেন।
Read more